講義資料

メイン資料

今日の資料はコチラから.

スマホで見る方はQRコードを読み込んでください

前回の復習

再現可能性(Reproducibility)の重要性

再現可能性に関する様々な議論と定義(Kulkarni, 2017

Goodmanによる定義(Goodman et.al, 2016):

  • 方法の再現可能性(Methods reproducibility):反復可能性にもっとも近い.研究方法とデータに関する十分な情報が提供され、同じ手順を反復できるようになっていることを意味する.

  • 結果の再現可能性(Results reproducibility):「方法の再現可能性」と密接に関連している.「元の実験と可能な限り同じ手順で,独立した実験を実施し,同じ結果を得ること」を意味する.

  • 推論の再現可能性(Inferential reproducibility):先の2つの再現可能性とは異なる。別の研究から同じ推論が導かれることもあれば,同じデータから別の結果が推測されることもある.このため,推論の再現可能性とは「独立した再現実験もしくは元の研究の再分析から,質的に類似した結果を導くこと」を意味する.

Stoddenによる定義(Stodden, 2014):

  • 実証的再現可能性(Empirical reproducibility):物理的に実験を繰り返して実証する必要なすべての情報が提供されていることを意味する.この定義は,グッドマン氏の「方法の再現可能性」の定義に近い.
  • 計算/統計的再現可能性(Computational and statistical reproducibility):研究における計算結果や分析結果を再び行うために欠かせないリソースが提供されていることを意味する.

Bakerによる定義(Baker, 2016):

  • 分析的反復(Analytic replication):単に元データを再分析して結果を再現すること.
  • 直接的反復(Direct replication):元の実験と同じ条件,材料,方法を利用しようとすること.
  • 体系的反復(Systematic replication):異なる実験条件で結果を再現しようとすること.(例えば,異なる細胞株やマウス株で実験を行うことなど.)
  • 概念的反復(Conceptual replication ):ある概念の一般的な正当性を示そうとすること.異なる有機体を使用する場合も含まれる.
再現可能なデータ分析とレポート作成のメリット(高橋, 2018)
  • 信頼性の向上
    • データ解析とは,得たデータを分析結果やグラフに変換すること
    • 同じデータからいつでもどこでも誰でも同じ結果を得られる必要がある
    • 分析が再現できることは,信頼性が高いことを示している.

※ 統計処理はあくまでも「プロセス」なので,決まった形式が存在している.同じ分析結果を出力するための技術は身につける必要がある.

  • 間違いの検証
    • 人間の作業には何らかの間違いが発生しがち.
    • 特に,分析過程でコードのどこかに間違いが存在することがある.
    • 再現可能なデータ分析を行うことで,間違いを探すことができる.

※ 間違ったことを責めるのではなく,どこに原因があるのかを探す&見つけられることが重要.

  • 作業効率の向上
    • 作業の大半を自動化できており,作業時間を減少することができる.
    • 間違いの検証にかかる時間も大幅に減少することが可能となる.
作業を進める際には以下のことを気をつけましょう.
  • データソースを手で加工,整形していないか
  • コピペを行っていないか
    • RのコードをRスクリプトにコピペする作業は除く
  • コンソールに直接コマンドを入力していないか
    • Rスクリプトを作成する際の動作確認やRスクリプトを実行するためのコマンドはコンソールに直接入力して良い
  • 手作業で結果やグラフの保存を行っていないか
  • 結果やグラフをコピペや手作業でレポートに貼り付けていないか
    • Rマークダウンでレポートを作る場合

RMarkdownの使い方

実際にRMarkdownでアウトプットを出力してみよう.
  • RMarkdownを立ち上げます.

  • 画面の通りクリックします.

  • Knitをクリックします.
    • 適宜保存等を行ってください.
    • テンプレート通りのアウトプットが行われます.
    • codeを保存しているフォルダにhtmlファイルができているので,確認してみよう.

Rmarkdownで編集するポイント
  • YAMLヘッダー:
    • RMarkdownのファイルのメタデータを設定
    • 著者情報の編集,出力ファイルの切り替え,目次の作成などの設定が可能
    • その他テンプレートなどをいろいろ組み合わせる.

  • チャンク:
    • コードを記述する部分

  • この間にRコードを記述する.
  • チャンクオプション:各チャンク内の動作を指定する.
チャンクオプション デフォルト オプションの意味
echo TRUE チャンク内での計算結果を出力として表示するか(TRUE)否か(FALSE).
error TRUE チャンク内でのエラーを表示するか否か.
eval TRUE チャンク内での計算結果を評価するか否か
fig.cap 図の注釈:fig.cap=“Figure1”
fig.height 7 図の縦幅(インチ)
fig.width 7 図の横幅(インチ)
include TRUE チャンク・実行結果を出力するか否か(FALSEでもコードは評価される).
message TRUE チャンク内でのパッケージの読み込みなどのメッセージを表示するか否か.
warning TRUE チャンク内での警告を表示するか否か.

今回のやること

Rマークダウンの記法

## テキストの修飾

*イタリック*

_イタリック_

**太字**

__太字__

~~取り消し~~

# 見出し1
## 見出し2
### 見出し3
#### 見出し4
##### 見出し5
###### 見出し6

# 数字なし箇条書き
* Item 1
* Item 2
    * Item 2.1
    * Item 2.2

# 数字あり箇条書き
1. Item 1
2. Item 2
    1. Item 2.1
    2. Item 2.2

# 改行
今日は   
いい天気ですね。

文章中で改行をしたい場合には、半角スペースを3つ打つ。

#リンク
http://www.yahoo.co.jp
はヤフーのURL   
[こちら](http://www.yahoo.co.jp)からヤフーに行けます。

# 引用文

学部長は

> 今日の天気はよろしくない

と、おっしゃった


> 学部長は

> > 今日の天気はよろしくない

> と、おっしゃった

という発言は、間違いである。とごとうは言った。



Rにおける合計を求める関数は`sum()`です。

## 数式

$$1 + 1 = 2$$
$$x * y = 15$$
$$(身長) = (体重)\beta + \alpha + \epsilon_i   $$

## 水平線

***
今日のお昼ご飯は何にしようかなぁ。

もう、最近仕事だらけでのんびりしたいなぁ。。。

---

その他の形式で出力してみよう.

  • html以外の出力形式:
    • YAMLヘッダを変えることでファイル形式を変えることができる.
    • 1回それぞれを試してみよう.
htmlの時
output: html_document
wordの時
output: word_document
ioslides(プレゼンテーションその1)の時
output: ioslides_presentation
slidy(プレゼンテーションその2)の時
output: slidy_presentation

データの順序付け

  • データの順序付け:データを分析しやすいように並び替えること.
    • 分析をしやすいように並べ変える必要があることがある.
    • Rでは自動的にアルファベット順に並べてくれる.
# A tibble: 963 x 54
   SUB_HAP SUB_SAT SUB_SLP DIC_PAR DIC_FRI DIC_OTH ULT_PRO_PAR ULT_PRO_FRI
     <dbl>   <dbl>   <dbl>   <dbl>   <dbl>   <dbl>       <dbl>       <dbl>
 1       4       4       9      10       5       3          10           5
 2       6       5       8       3       1       0           3           5
 3       5       3       3      10       5       0          10           5
 4       5       5       4       2       0       0           5           5
 5       3       3       2       0       0       0           5           5
 6       7       7       6       3       1       0           3           1
 7       5       5       6       5       2       0           5           3
 8       5       5       8       5       5       0           5           5
 9       1       3       1      10       5       0          10           5
10       7       7       5       5       5       0           5           5
# … with 953 more rows, and 46 more variables: ULT_PRO_OTH <dbl>,
#   ULT_REC_PAR <dbl>, ULT_REC_FRI <dbl>, ULT_REC_OTH <dbl>,
#   TRU_PAR <dbl>, TRU_FRI <dbl>, TRU_OTH <dbl>, SPN_UNM <dbl>,
#   SPN_THK <dbl>, SPN_FEA <dbl>, SPN_LIV <dbl>, SPN_IMP <dbl>,
#   KAN_SEC <dbl>, KAN_THI <dbl>, KAN_SUP <dbl>, KAN_PRD <dbl>,
#   KAN_KYK <dbl>, DED_SHI <dbl>, DED_TEN <dbl>, DED_JIG <dbl>,
#   DED_KIS <dbl>, DED_PUN <dbl>, SEX_IMP <dbl>, SEX_MAS <dbl>,
#   SEX_SEX <dbl>, SEX_OBJ <chr>, SEX_NIN <chr>, SEX_NNA <dbl>,
#   SEX_IMP_num <dbl>, SEX_MAS_nen <dbl>, SEX_SEX_nen <dbl>,
#   SEX_NIN_cen <dbl>, F_SEX <chr>, F_GEN_2 <chr>, F_GEN <chr>,
#   F_FGR <chr>, F_INK <chr>, F_INS <chr>, F_INK_cen <dbl>,
#   F_INS_cen <dbl>, F_TAN <chr>, ARE <chr>, PRE <dbl>, MAR <chr>,
#   CHI <chr>, ID <dbl>
地域を並べ替える.
  [1] Hokkaido Chubu    Chubu    Kanto    Kyushu   Chubu    Kanto   
  [8] Chubu    Chubu    Kanto    Kinki    Tohoku   Kyushu   Kyushu  
 [15] Chugoku  Tohoku   Kanto    Chugoku  Hokkaido Kanto    Hokkaido
 [22] Chubu    Chubu    Kanto    Kanto    Hokkaido Kanto    Chubu   
 [29] Kinki    Chubu    Kanto    Chubu    Kinki    Kanto    Kanto   
 [36] Kanto    Kinki    Kanto    Tohoku   Kanto    Chubu    Kinki   
 [43] Kanto    Kyushu   Kyushu   Tohoku   Kinki    Shikoku  Kanto   
 [50] Kinki    Kyushu   Kanto    Chugoku  Kyushu   Kanto    Kinki   
 [57] Kinki    Kyushu   Chugoku  Kyushu   Kanto    Kanto    Kyushu  
 [64] Chubu    Kinki    Chugoku  Kanto    Kanto    Kanto    Kanto   
 [71] Kanto    Kanto    Kanto    Kinki    Kinki    Kanto    Kanto   
 [78] Kanto    Kinki    Chubu    Tohoku   Kinki    Kanto    Kanto   
 [85] Kinki    Hokkaido Tohoku   Kanto    Kinki    Kinki    Kanto   
 [92] Kanto    Kanto    Chugoku  Chubu    Kanto    Kyushu   Kanto   
 [99] Chubu    Chugoku  Tohoku   Chubu    Kanto    Kinki    Kyushu  
[106] Chugoku  Kanto    Hokkaido Kanto    Kinki    Kanto    Chugoku 
[113] Chubu    Tohoku   Chugoku  Chubu    Kanto    Kanto    Chugoku 
[120] Chubu    Kanto    Chugoku  Kanto    Kyushu   Kanto    Chubu   
[127] Chubu    Chubu    Kyushu   Hokkaido Kinki    Kanto    Kanto   
[134] Kanto    Kanto    Kanto    Kanto    Kanto    Kinki    Tohoku  
[141] Kanto    Kanto    Kinki    Kanto    Shikoku  Kinki    Chugoku 
[148] Kanto    Kanto    Chugoku  Chubu    Tohoku   Hokkaido Kanto   
[155] Kyushu   Chubu    Kanto    Kanto    Chubu    Shikoku  Kyushu  
[162] Chubu    Chugoku  Kanto    Kanto    Chubu    Tohoku   Kinki   
[169] Chubu    Chubu    Kanto    Kanto    Chubu    Chugoku  Chugoku 
[176] Chugoku  Kanto    Kyushu   Kanto    Kanto    Chugoku  Kanto   
[183] Kinki    Kanto    Kanto    Chubu    Chubu    Chugoku  Kanto   
[190] Kanto    Kanto    Kinki    Kinki    Kanto    Kanto    Kanto   
[197] Shikoku  Hokkaido Chubu    Kanto    Kinki    Kanto    Kanto   
[204] Chubu    Chugoku  Shikoku  Kanto    Chubu    Chubu    Kanto   
[211] Kyushu   Kanto    Chugoku  Kanto    Kanto    Kanto    Kanto   
[218] Kinki    Kanto    Kinki    Kanto    Tohoku   Kanto    Hokkaido
[225] Kinki    Kanto    Kanto    Hokkaido Kanto    Kyushu   Kanto   
[232] Kinki    Tohoku   Kanto    Kinki    Kinki    Tohoku   Kanto   
[239] Kanto    Kanto    Kanto    Kanto    Kanto    Kanto    Chugoku 
[246] Kinki    Hokkaido Chugoku  Kanto    Kinki    Chubu    Kanto   
[253] Kanto    Chugoku  Shikoku  Chubu    Kyushu   Kanto    Chubu   
[260] Tohoku   Kanto    Kanto    Kanto    Tohoku   Kyushu   Kanto   
[267] Kinki    Chubu    Chubu    Hokkaido Kinki    Kinki    Kyushu  
[274] Kanto    Kanto    Chubu    Kyushu   Chubu    Kinki    Kanto   
[281] Shikoku  Kanto    Kanto    Kanto    Kinki    Kyushu   Kinki   
[288] Kyushu   Hokkaido Kinki    Kanto    Kanto    Kyushu   Kanto   
[295] Kanto    Kinki    Kinki    Kanto    Kinki    Tohoku   Chubu   
[302] Chubu    Kinki    Kanto    Kyushu   Kinki    Kinki    Kanto   
[309] Kinki    Chubu    Kinki    Kinki    Kanto    Kanto    Hokkaido
[316] Kyushu   Shikoku  Kinki    Chubu    Kanto    Chubu    Chugoku 
[323] Kanto    Kinki    Kanto    Kanto    Tohoku   Chubu    Tohoku  
[330] Kinki    Shikoku  Kanto    Kanto    Kanto    Kanto    Kanto   
[337] Chugoku  Kinki    Kanto    Kinki    Kanto    Chubu    Kanto   
[344] Kinki    Kanto    Kyushu   Chubu    Chubu    Kanto    Chubu   
[351] Kanto    Kanto    Tohoku   Chubu    Kinki    Kanto    Chugoku 
[358] Kinki    Tohoku   Kanto    Kinki    Chubu    Kinki    Chubu   
[365] Chubu    Kinki    Kanto    Kinki    Kanto    Tohoku   Kinki   
[372] Kyushu   Kanto    Kanto    Shikoku  Tohoku   Shikoku  Kyushu  
[379] Kanto    Kanto    Tohoku   Chugoku  Chubu    Kanto    Kanto   
[386] Chubu    Kinki    Shikoku  Kanto    Kanto    Hokkaido Kanto   
[393] Kinki    Chubu    Kanto    Kanto    Kanto    Kanto    Chubu   
[400] Kyushu   Kanto    Kinki    Chubu    Kanto    Chubu    Kanto   
[407] Kanto    Kanto    Kinki    Tohoku   Kanto    Kyushu   Kinki   
[414] Kanto    Hokkaido Kanto    Chubu    Kanto    Kyushu   Kinki   
[421] Chugoku  Chubu    Chubu    Kinki    Kanto    Kanto    Kinki   
[428] Chubu    Kanto    Kanto    Kinki    Kanto    Kanto    Chubu   
[435] Kanto    Kanto    Kanto    Hokkaido Kinki    Kanto    Kinki   
[442] Chugoku  Kanto    Chubu    Hokkaido Chugoku  Kinki    Chubu   
[449] Tohoku   Kyushu   Kinki    Kinki    Kanto    Kyushu   Kyushu  
[456] Kyushu   Kanto    Tohoku   Kanto    Hokkaido Kyushu   Kinki   
[463] Kanto    Kyushu   Tohoku   Shikoku  Kanto    Chubu    Chugoku 
[470] Chubu    Kyushu   Kinki    Chubu    Kanto    Kyushu   Kanto   
[477] Kanto    Kanto    Chubu    Kanto    Kanto    Kanto    Kanto   
[484] Kanto    Chubu    Kanto    Kinki    Tohoku   Kanto    Hokkaido
[491] Kanto    Chubu    Tohoku   Chubu    Kanto    Kanto    Kinki   
[498] Kinki    Kyushu   Kinki    Kanto    Kanto    Kinki    Kanto   
[505] Kyushu   Kanto    Chubu    Kinki    Chubu    Kanto    Kinki   
[512] Kyushu   Chubu    Kanto    Chugoku  Tohoku   Kyushu   Kinki   
[519] Kanto    Kinki    Kanto    Kanto    Kanto    Tohoku   Chugoku 
[526] Chubu    Kinki    Kinki    Kanto    Kanto    Kanto    Kanto   
[533] Kanto    Kinki    Kanto    Kinki    Kanto    Kanto    Kinki   
[540] Chubu    Kanto    Kanto    Tohoku   Kanto    Chubu    Tohoku  
[547] Kanto    Kanto    Chubu    Chubu    Kanto    Chubu    Kanto   
[554] Tohoku   Chugoku  Chubu    Kanto    Chugoku  Kanto    Kanto   
[561] Kinki    Kyushu   Kanto    Chubu    Kinki    Kanto    Kinki   
[568] Kinki    Hokkaido Kanto    Kanto    Kanto    Tohoku   Kanto   
[575] Kinki    Kinki    Kanto    Kanto    Kanto    Kanto    Chubu   
[582] Kanto    Kyushu   Chugoku  Kinki    Kanto    Kanto    Chubu   
[589] Kanto    Kyushu   Kanto    Kinki    Kanto    Kyushu   Chubu   
[596] Chubu    Chubu    Kanto    Kanto    Chugoku  Tohoku   Chubu   
[603] Kanto    Kanto    Kinki    Kanto    Chugoku  Kanto    Shikoku 
[610] Kanto    Hokkaido Chugoku  Kyushu   Chubu    Kanto    Kanto   
[617] Kanto    Kanto    Kyushu   Chubu    Kanto    Kanto    Chugoku 
[624] Chugoku  Shikoku  Kanto    Chugoku  Kanto    Kanto    Kyushu  
[631] Hokkaido Kinki    Chubu    Kanto    Kyushu   Kanto    Tohoku  
[638] Kinki    Kanto    Kanto    Kanto    Chubu    Kanto    Kanto   
[645] Kyushu   Chubu    Kanto    Chubu    Chubu    Kanto    Kanto   
[652] Kyushu   Chubu    Kanto    Kyushu   Chubu    Kinki    Kinki   
[659] Kinki    Kanto    Hokkaido Kanto    Kanto    Kyushu   Kanto   
[666] Kyushu   Shikoku  Tohoku   Kyushu   Kanto    Kinki    Kinki   
[673] Chubu    Hokkaido Kanto    Kanto    Kanto    Chubu    Kinki   
[680] Kanto    Kinki    Kanto    Kinki    Kanto    Chugoku  Kyushu  
[687] Tohoku   Kyushu   Tohoku   Chubu    Kanto    Kinki    Hokkaido
[694] Kanto    Kanto    Kanto    Kinki    Kinki    Kanto    Kanto   
[701] Kanto    Chubu    Chubu    Kanto    Kinki    Chubu    Kanto   
[708] Kanto    Kinki    Chugoku  Kinki    Tohoku   Chubu    Chubu   
[715] Kanto    Chubu    Kanto    Kanto    Chubu    Kinki    Kyushu  
[722] Kyushu   Kyushu   Kanto    Chubu    Kanto    Hokkaido Kanto   
[729] Kinki    Hokkaido Kanto    Kanto    Chugoku  Kanto    Tohoku  
[736] Chugoku  Chubu    Tohoku   Kinki    Kyushu   Chugoku  Chugoku 
[743] Chubu    Kanto    Chubu    Chubu    Kinki    Kyushu   Chubu   
[750] Kinki    Kinki    Chugoku  Chubu    Chubu    Chubu    Kinki   
[757] Kyushu   Kinki    Kinki    Chugoku  Kyushu   Chubu    Chubu   
[764] Kanto    Kyushu   Shikoku  Kanto    Kinki    Kanto    Kanto   
[771] Kanto    Chubu    Kinki    Kinki    Hokkaido Kanto    Kanto   
[778] Chubu    Kanto    Kyushu   Kinki    Chugoku  Kanto    Kanto   
[785] Kyushu   Chubu    Chugoku  Kinki    Kyushu   Kanto    Kanto   
[792] Tohoku   Tohoku   Tohoku   Kyushu   Tohoku   Kanto    Kanto   
[799] Kanto    Kanto    Tohoku   Chugoku  Chubu    Kanto    Kinki   
[806] Chubu    Kinki    Chubu    Kanto    Kinki    Kinki    Kanto   
[813] Kanto    Tohoku   Chubu    Kanto    Tohoku   Kanto    Kinki   
[820] Kyushu   Chubu    Kanto    Chugoku  Kanto    Kanto    Kinki   
[827] Chugoku  Chugoku  Kanto    Kyushu   Tohoku   Tohoku   Hokkaido
[834] Kanto    Kyushu   Chubu    Kanto    Chubu    Tohoku   Chubu   
[841] Kinki    Kinki    Kanto    Kanto    Kinki    Chubu    Kinki   
[848] Kyushu   Hokkaido Kyushu   Chubu    Chubu    Kanto    Tohoku  
[855] Kanto    Kanto    Kyushu   Kanto    Kinki    Kanto    Kanto   
[862] Kinki    Kinki    Kanto    Kanto    Kinki    Tohoku   Kanto   
[869] Kinki    Kanto    Kanto    Chugoku  Chubu    Tohoku   Kanto   
[876] Kanto    Kanto    Kanto    Kyushu   Kanto    Kanto    Chubu   
[883] Kyushu   Kinki    Kyushu   Tohoku   Chugoku  Kyushu   Kinki   
[890] Kanto    Kinki    Kyushu   Kinki    Kanto    Kanto    Kanto   
[897] Kanto    Kinki    Tohoku   Kanto    Tohoku   Kinki    Kanto   
[904] Kanto    Kinki    Kinki    Tohoku   Kyushu   Kanto    Kinki   
[911] Chubu    Hokkaido Kanto    Kinki    Kanto    Kanto    Chugoku 
[918] Kanto    Tohoku   Kanto    Chugoku  Chugoku  Hokkaido Kyushu  
[925] Kanto    Kyushu   Kanto    Kanto    Chubu    Kanto    Kinki   
[932] Chugoku  Chubu    Kanto    Kanto    Tohoku   Kanto    Kanto   
[939] Kanto    Chubu    Shikoku  Kinki    Kyushu   Kanto    Hokkaido
[946] Chubu    Tohoku   Kinki    Kanto    Chubu    Kanto    Chubu   
[953] Kanto    Kinki    Kanto    Chubu    Kinki    Kyushu   Kyushu  
[960] Kanto    Chugoku  Kyushu   Kinki   
Levels: Chubu Chugoku Hokkaido Kanto Kinki Kyushu Shikoku Tohoku
  • 今のままだと中部,中国,北海道,関東,近畿,九州,四国,東北という順番で気持ちが悪い
  • 関東を一番始めとして.北から順番に並べ替えましょう.
  • head()を使うと最初の5つのデータだけを表示してくれる.
  • 全部並べると植えみたいに長くなってめんどくさいじゃない?
[1] Hokkaido Chubu    Chubu    Kanto    Kyushu   Chubu   
Levels: Kanto Hokkaido Tohoku Chubu Kinki Chugoku Shikoku Kyushu
  • Levelsを確認すると,関東を始めとして,北海道,東北,中部,近畿,中国,四国,九州の順番に並べ替えられる.
  • 『関東』を最初にする理由は今後紹介するが,「比較の基準」とするモノを

アドインの追加

install.packages("addinslist")
  • インストールした後に,Addinsをクリックする.
  • “order”で検索
  • “questionr”をインストール
  • RStudioをとじて,再度立ち上げる.
  • “Addins”→“Levels Ordering”を選択
  • “exdataset”→“ARE”を選択
  • “Ordering”タブを選んで,並べ替える.
結婚と子どもの有無についても並べ替えよう.
[1] Married    NotMarried Married    NotMarried Married    NotMarried
Levels: Married NotMarried
  • NoChild(子どもなし)を最初として,次にChild(子どもあり)として並べ替えよう.
[1] Child   NoChild Child   NoChild NoChild Child  
Levels: Child NoChild
  • NoChild(子どもなし)を最初として,次にChild(子どもあり)として並べ替えよう.

  • 並べ替えを手抜きするために“Addin”を使おう.
    • そうすればクリックだけでいろいろできる.

データのフィルタリング

  • データのフィルタリングとは:データを一定の基準で分けること
    • ex.データを男性によるデータと女性によるデータに分けて分析を行う

男性のデータだけを取り出す.

  • exdataset$F_SEXmale(男性)のみを取り出して,exdataset_maleというデータセットを作ってSUB_HAP(主観的幸福度)の平均値を算出してみましょう.

  • 最初にデータ全体の主観的幸福度の平均値を確認しておきましょう.
[1] 6.002077
[1] male male male male male male
Levels: male
[1] 5.491358

女性のデータだけを取り出す.

  • exdataset$F_SEXfemale(女性)のみを取り出して,exdataset_femaleというデータセットを作ってSUB_HAP(主観的幸福度)の平均値を算出してみましょう.
    • 各自でやってみましょう.

今日のTake Home Messages

RMarkdownの記法

  • RMarkdown:
    • R上でドキュメントを作成するツール
    • htmlでもWordでもhtmlプレゼンテーション形式でも報告可能
    • 様々な記法を覚えましょう.  
  • データ分析をするためには,データを適切に取り扱う必要がある.
    • filterで分けたり,順番を並べ替えたり.

Rでデータを扱う時に注意すべきこと

  • 必ず数字/文字は半角で入力する.
  • 日本語は使わずにローマ字を使用する.
  • コメントアウト(コードではなく,関係ないメモを入れること)をするときは半角の「#」から始める.
    • メモする内容は全角でもよい.
  • ファイル名およびパスには決して全角の文字(ひらがな,カタカナ,漢字,全角スペースなど)を入れてはいけない.
    • 半角英数字だけにする.
  • 慌てずに落ち着いて操作すれば,決して難しくない.
    • 1つずつ落ち着いて作業することを心がける.
  • 「わからない」ことを恐れない
    • 周りの友人に聞いたり,教員に確認したりしよう.
  • 文字化け対策にこちら のp8以降を確認して設定しよう.

演習問題

問題

問題

演習問題:

  • 次回までにご自身で分析してみたいテーマ(回帰分析1つ)+(t検定1つ)+(分散分析1つ)の帰無仮説と対立仮説を考えてきてください.

    • exdataset$MARMarried(既婚者)のみを取り出して,exdataset_Marriedというデータセットを作ってSUB_HAP(主観的幸福度)の平均値を算出してみましょう.

    • exdataset$MARNotMarried(未既婚者)のみを取り出して,exdataset_NotMarriedというデータセットを作ってSUB_HAP(主観的幸福度)の平均値を算出してみましょう

    • exdataset$CHIChild(子どもあり)のみを取り出して,exdataset_Childというデータセットを作ってSUB_HAP(主観的幸福度)の平均値を算出してみましょう

    • exdataset$CHINoChild(子どもなし)のみを取り出して,exdataset_NoChildというデータセットを作ってSUB_HAP(主観的幸福度)の平均値を算出してみましょう

リアクションペーパー:

  • 授業で学んだことおよび感想を下記リンクからお答えください.

リアクションペーパー

ヒント

  • こんなことがかかわるかも?
    • なんて,演習問題によってヒントが出たり何だりします.
    • ヒントがない時は気合でがんばりましょう.

データの概要

データ概要

ダウンロードはコチラから

変数名リスト

主観的指標

項目名 データタイトル 質問項目 回答
主観的幸福度 SUB_HAP 現在,あなたはどの程度幸せですか?「とても幸せ」を10点,「とても不幸せ」を0点とすると,何点くらいになると思いますか?* 0点「とても不幸せ」-10点「とても幸せ」
生活満足度 SUB_SAT あなたは全体として最近の生活にどの程度満足していますか?「とても満足」を10点,「とても不満足」を0点とすると,何点くらいになると思いますか? 0点「とても不満足」-10点「とても満足」
生活満足度 SUB_SLP あなたは最近,どの程度眠れていますか?「とても眠れている」を10点,「全く眠れていない」を0点とすると,何点くらいになると思いますか? 0点「全く眠れていない」-10点「とても眠れている」

独裁者ゲーム

図を見て下さい.
あなたはAさんです. あなたはTポイントを10ポイントを受け取りました.
そのうち,あなたはBさんに何ポイントかを渡すことができます.
さて,あなたはBさんに何ポイント渡しますか?
ここでは以下の条件の場合について教えて下さい.

項目名 データタイトル 質問項目 回答
主観的幸福度 DIC_PAR Bさんが両親の場合 0ポイント-10ポイント
DG友人条件 DIC_FRI Bさんが友人の場合 0ポイント-10ポイント
DG他者条件 DIC_OTH Bさんが全く知らない他人の場合 0ポイント-10ポイント

最終提案ゲーム_提案者

図を見て下さい.
あなたはAさんです. あなたはTポイントを10ポイントを受け取りました.
そのうち,あなたはBさんとポイントを分け合うことになりました.
あなたは,Bさんに対して分け合うポイントを提案することができます.
あなたは,10ポイントの中から,Bさんに対して分けたポイントを引いた残りを受け取ることができます.
しかし,Bさんがあなたの提案を拒否した場合には,その提案は実現せずに,
お互いポイントをもらえないことになります.
さて,あなたはBさんに何ポイント渡すことを提案しますか?
ここでは以下の条件の場合について教えて下さい.

項目名 データタイトル 質問項目 回答
最終提案提案者両親条件 ULT_PRO_PAR Bさんが両親の場合 0ポイント-10ポイント
最終提案提案者友人条件 ULT_PRO_FRI Bさんが友人の場合 0ポイント-10ポイント
最終提案提案者他者条件 ULT_PRO_OTH Bさんが全く知らない他人の場合 0ポイント-10ポイント

最終提案ゲーム_応答者

図を見て下さい. あなたはBさんです. AさんはTポイントを10ポイントを受け取りました.
Aさんが,あなたに対して分け合うポイントを提案します.
Aさんは,10ポイントの中から,あなたに対して分けたポイントを引いた残りを受け取ることができます.
しかし,あなたがAさんの提案を拒否した場合には,その提案は実現せずに,
お互いポイントをもらえないことになります.
さて,最低でも何ポイントの提案を受けたら,Aさんの提案を受け入れますか?
ここでは以下の条件の場合について教えて下さい.

項目名 データタイトル 質問項目 回答
最終提案応答者両親条件 ULT_REC_PAR Bさんが両親の場合 0ポイント-10ポイント
最終提案応答者友人条件 ULT_REC_FRI Bさんが友人の場合 0ポイント-10ポイント
最終提案応答者他者条件 ULT_REC_OTH Bさんが全く知らない他人の場合 0ポイント-10ポイント

信頼ゲーム

図を見て下さい.
あなたはAさんです. あなたはTポイントを10ポイント持っています.
いくらかをCさんにあずけてください. CさんはあなたからあずかったTポイントを3倍にしてBさんに渡します.
Bさんは手元に渡されたポイントのうち,いくらかをあなたに返します.
この時,あなたはCさんにいくらあずけますか?
ここではBさんが以下の条件の場合について教えて下さい.

項目名 データタイトル 質問項目 回答
信頼両親条件 TRU_PAR Bさんが両親の場合 0ポイント-10ポイント
信頼友人条件 TRU_FRI Bさんが友人の場合 0ポイント-10ポイント
信頼他者条件 TRU_OTH Bさんが全く知らない他人の場合 0ポイント-10ポイント

自然関連

以下の質問について4点満点でお答えください.

項目名 データタイトル 質問項目 回答
自然運命 SPN_UNM 何かの大きな力に自分の運命は動かされているように感じることがある. 1全くそう思わない-4非常にそう思う
自然感謝 SPN_THK 自然などの人間を超えた力に感謝の気持ちを持つことがある. 1全くそう思わない-4非常にそう思う
自然恐怖 SPN_FEA 自然などの人間を超えた力に恐れの気持ちを持つことがある. 1全くそう思わない-4非常にそう思う
自然生存 SPN_LIV 自然などの人間を超えた力によって,生かされていると思うことがある. 1全くそう思わない-4非常にそう思う
自然大切 SPN_IMP 自然は大切な存在である. 1全くそう思わない-4非常にそう思う

監視

以下の質問について4点満点でお答えください.

項目名 データタイトル 質問項目 回答
第2者被監視感 KAN_SEC 日常生活の中で,直接誰か(人間)に見られていると思うことがある. 1全くそう思わない-4非常にそう思う
第3者被監視感 KAN_THI 日常生活の中で,監視カメラ等を通じて誰か(人間)に間接的に見られていると思うことがある. 1全くそう思わない-4非常にそう思う
超自然的被監視感 KAN_SUP 日常生活の中で,超自然的な存在に見られていると思うことがある. 1全くそう思わない-4非常にそう思う
第2者被監視感 KAN_PRD 無機物の中に,人間の表情のようなものを見出すことがある. 1全くそう思わない-4非常にそう思う
自然大切 KAN_KYK 人に対して共感をすることがある. 1全くそう思わない-4非常にそう思う

死後

以下の質問について4点満点でお答えください.

項目名 データタイトル 質問項目 回答
死後世界 DED_SHI 「死後の世界」が存在すると思いますか? 1全くそう思わない-4非常にそう思う
天国 DED_TEN 「天国」が存在すると思いますか? 1全くそう思わない-4非常にそう思う
地獄 DED_JIG 「地獄」が存在すると思いますか? 1全くそう思わない-4非常にそう思う
奇跡 DED_KIS 「奇跡」が存在すると思いますか? 1全くそう思わない-4非常にそう思う
天罰 DED_PUN 「天罰」が存在すると思いますか? 1全くそう思わない-4非常にそう思う

性行動

以下の質問についてお答えください.

項目名 データタイトル 質問項目 回答
性衝動 SEX_IMP,SEX_IMP_num(数値,欠損値有り) あなたの性衝動はどの程度強いと思いますか?7点満点でお答え下さい.なお,答えたくない方は「8.答えたくない」を選んで下さい. 全く弱い.2. 弱い.3. どちらかと言えば弱い.4. どちらとも言えない.5. どちらかと言えば強い.6. 強い.7. 非常に強い.8. 答えたくない.
自慰回数 SEX_MAS,SEX_MAS_nen(年間回数): あなたはどの程度の頻度でマスターベーションをしていますか?以下の選択肢の中から最も近いものを選んで下さい.なお,答えたくない方は「10. 答えたくない」を選んで下さい. 1. 経験がない「0」, 2. 年に1回程度「1」, 3. 半年に1回程度「2」, 4. 3ヶ月に1回程度「4」, 5. 1ヶ月に1回程度「12」, 6. 2週に1回程度「26」, 7. 週に1回程度「52」, 8. 週に2-3回程度「130」, 9. 1日に1回程度「365」, 10. それ以上「730」, 11. 答えたくない「NA」
性交渉回数 SEX_SEX,SEX_SEX_nen(年間回数) あなたはどの程度の頻度で性交渉(性行為)をしていますか?以下の選択肢の中から最も近いものを選んで下さい.なお,答えたくない方は「10. 答えたくない」を選んで下さい. 1. 経験がない「0」, 2. 年に1回程度「1」, 3. 半年に1回程度「2」, 4. 3ヶ月に1回程度「4」, 5. 1ヶ月に1回程度「12」, 6. 2週に1回程度「26」, 7. 週に1回程度「52」, 8. 週に2-3回程度「130」, 9. 1日に1回程度「365」, 10. それ以上「730」, 11. 答えたくない「NA」
性衝動対象 SEX_OBJ あなたの性衝動の対象として当てはまる選択肢を選んで下さい.なお,答えたくない方は「5.答えたくない」を選んで下さい. 1.異性, 2. 同性,3. 両方,4. その他,5. 答えたくない
天罰 SEX_NIN,SEX_NIN_cen(中央値) あなたが性交渉(性行為)をしたことがある人数を教えて下さい.* 性交渉を(性行為)したことがない場合は「0. 0人」を選んで下さい. また,答えたくない方は「12.答えたくない」を選んで下さい. 1. 0人 「0」, 2. 1人 「1」, 3. 2〜3人 「2.5」, 4. 4〜5人 「4.5」, 5. 5〜7人 「6」, 6. 8〜10人 「9」, 7. 11〜15人 「13」, 8. 16〜20人 「18」, 9. 21〜30人 「25.5」, 10. 31〜40人 「35.5」, 11. 41〜100人 「70.5」, 12. 101人以上 「101」, 13. 答えたくない.「NA」
性情報開示 SEX_NNA 性情報に対して開示しなかった個数 上記5つについて答えたくないを選んだ個数

フェイスシート

あなたのことについて教えて下さい.

項目名 データタイトル 質問項目 回答
性別 F_SEX あなたの性別を教えて下さい. 1.男性, 2.女性,3.その他
世代 F_GEN あなたの年齢を教えて下さい. 1. 10代前半, 2. 10代後半, 3. 20代前半, 4. 20代後半, 5. 30代前半, 6. 30代後半, 7. 40代前半, 8. 40代後半, 9. 50代前半, 10. 50代前半, 11. 60代前半, 12. 60代後半, 13. 70代以降
最終学歴 F_FGR あなたの最終学歴を教えて下さい. 1. 中学校卒業, 2. 高校中退, 3. 高校卒業, 4. 専門学校(短期大学)中退, 5. 専門学校(短期大学)卒業, 6. 大学中退, 7. 大学卒業, 8. 大学院修士課程(博士前期課程)中退, 9. 大学院修士課程(博士前期課程)修了, 10. 大学院博士課程(博士後期課程)中退, 11. 大学院博士課程(博士後期課程)修了
個人収入 F_INK,F_INK_cen(中央値,百万円) あなた個人の年収を教えて下さい. 0. 0円, 1. 1円〜200万円未満, 2. 200万円以上〜400万円未満, 3. 400万円以上〜600万円未満, 4. 600万円以上〜800万円未満, 5. 800万円以上〜1,000万円未満, 6. 1,000万円以上〜1,200万円未満, 7. 1,200万円以上〜1,500万円未満, 8. 1,500万円以上〜2,000万円未満, 9. 2,000万円以上, 10. わからない
世帯収入 F_INS,F_INS_cen(中央値,百万円) あなたの世帯での収入の合計を教えて下さい. 0. 0円, 1. 1円〜200万円未満, 2. 200万円以上〜400万円未満, 3. 400万円以上〜600万円未満, 4. 600万円以上〜800万円未満, 5. 800万円以上〜1,000万円未満, 6. 1,000万円以上〜1,200万円未満, 7. 1,200万円以上〜1,500万円未満, 8. 1,500万円以上〜2,000万円未満, 9. 2,000万円以上, 10. わからない
回答端末 F_TAN あなたが現在回答に使われているケータイ/タブレット/パソコンについて,当てはまるものを選んで下さい. 1. パソコン(Windows), 2. パソコン(Mac), 3. パソコン(その他), 4. タブレット(Windows), 5. タブレット(iOS,iPad), 6. タブレット(android), 7. タブレット(その他), 8. スマホ(Windows), 9. スマホ(iOS,iPhone), 10. スマホ(android), 11. スマホ(その他), 12. ガラケー,フィーチャーホン, 13. その他
都道府県 PRE あなたのお住まいの県を教えて下さい. 1. 北海道2. 青森県3. 岩手県4. 宮城県5. 秋田県6. 山形県7. 福島県8. 茨城県9. 栃木県10. 群馬県11. 埼玉県12. 千葉県13. 東京都14. 神奈川県15. 新潟県16. 富山県17. 石川県18. 福井県19. 山梨県20. 長野県21. 岐阜県22. 静岡県23. 愛知県24. 三重県25. 滋賀県26. 京都府27. 大阪府28. 兵庫県29. 奈良県30. 和歌山県31. 鳥取県32. 島根県33. 岡山県34. 広島県35. 山口県36. 徳島県37. 香川県38. 愛媛県39. 高知県40. 福岡県41. 佐賀県42. 長崎県43. 熊本県44. 大分県45. 宮崎県46. 鹿児島県47. 沖縄県
地域 ARE 都道府県から地域に変換 北海道:1. 北海道,東北地方:2. 青森県3. 岩手県4. 宮城県5. 秋田県6. 山形県7. 福島県,関東地方:8. 茨城県9. 栃木県10. 群馬県11. 埼玉県12. 千葉県13. 東京都14. 神奈川県,中部地方:15. 新潟県16. 富山県17. 石川県18. 福井県19. 山梨県20. 長野県21. 岐阜県22. 静岡県23. 愛知県24. 三重県,近畿地方:25. 滋賀県26. 京都府27. 大阪府28. 兵庫県29. 奈良県30. 和歌山県,中国地方:31. 鳥取県32. 島根県33. 岡山県34. 広島県35. 山口県,四国地方:36. 徳島県37. 香川県38. 愛媛県39. 高知県,九州地方:40. 福岡県41. 佐賀県42. 長崎県43. 熊本県44. 大分県45. 宮崎県46. 鹿児島県47. 沖縄県
未既婚 MAR あなたはご結婚されていますか? NotMarried:未婚,Married:既婚
子の有無 CHI あなたはお子さんがいらっしゃいますか? NoChild:いない,Child:いる
---
title: "データ解析論I第5講"
output: 
  flexdashboard::flex_dashboard:
    vertical-layout: scroll
    orientation: columns
    source_code: embed
    theme: journal
    toc: true
    toc_depth: 2
    fig_mobile: true
    highlight: pygments
    css: styles_customized.css

---

```{r setup, include=FALSE}
library(flexdashboard)
library(readr)
exdataset <- read_csv("/Users/akira/Dropbox/Education/2019MEIJI/[3_Wed2]Data_Analytics/analysis/data/exdataset.csv")
library(ggplot2)

```




# 講義資料


## メイン資料 {.tabset .tabset-fade}

### 今日の資料はコチラから.

スマホで見る方は**QRコード**を読み込んでください
### 前回の復習 #### 再現可能性(Reproducibility)の重要性 ##### 再現可能性に関する様々な議論と定義([Kulkarni, 2017](https://www.editage.jp/insights/irreproducibility-is-the-lack-of-an-accepted-definition-a-problem-in-itself)) Goodmanによる定義([Goodman et.al, 2016](https://stm.sciencemag.org/content/8/341/341ps12)): * **方法の再現可能性**(Methods reproducibility):反復可能性にもっとも近い.研究方法とデータに関する十分な情報が提供され、同じ手順を反復できるようになっていることを意味する. * 結果の再現可能性(Results reproducibility):「方法の再現可能性」と密接に関連している.「元の実験と可能な限り同じ手順で,独立した実験を実施し,同じ結果を得ること」を意味する. * 推論の再現可能性(Inferential reproducibility):先の2つの再現可能性とは異なる。別の研究から同じ推論が導かれることもあれば,同じデータから別の結果が推測されることもある.このため,推論の再現可能性とは「独立した再現実験もしくは元の研究の再分析から,質的に類似した結果を導くこと」を意味する. Stoddenによる定義([Stodden, 2014](https://web.stanford.edu/~vcs/talks/OpenConNov152014-STODDEN.pdf)): * 実証的再現可能性(Empirical reproducibility):物理的に実験を繰り返して実証する必要なすべての情報が提供されていることを意味する.この定義は,グッドマン氏の「方法の再現可能性」の定義に近い. * **計算/統計的再現可能性**(Computational and statistical reproducibility):研究における計算結果や分析結果を再び行うために欠かせないリソースが提供されていることを意味する. Bakerによる定義([Baker, 2016](https://www.nature.com/news/muddled-meanings-hamper-efforts-to-fix-reproducibility-crisis-1.20076)): * **分析的反復**(Analytic replication):単に元データを再分析して結果を再現すること. * 直接的反復(Direct replication):元の実験と同じ条件,材料,方法を利用しようとすること. * 体系的反復(Systematic replication):異なる実験条件で結果を再現しようとすること.(例えば,異なる細胞株やマウス株で実験を行うことなど.) * 概念的反復(Conceptual replication ):ある概念の一般的な正当性を示そうとすること.異なる有機体を使用する場合も含まれる. ##### 再現可能なデータ分析とレポート作成のメリット(高橋, 2018) * **信頼性**の向上 - データ解析とは,得たデータを分析結果やグラフに変換すること - 同じデータからいつでもどこでも誰でも同じ結果を得られる必要がある - 分析が再現できることは,信頼性が高いことを示している. ※ 統計処理はあくまでも「プロセス」なので,決まった形式が存在している.同じ分析結果を出力するための技術は身につける必要がある. * **間違い**の検証 - 人間の作業には何らかの間違いが発生しがち. - 特に,分析過程でコードのどこかに間違いが存在することがある. - 再現可能なデータ分析を行うことで,間違いを探すことができる. ※ 間違ったことを責めるのではなく,どこに原因があるのかを探す&見つけられることが重要. * **作業効率**の向上 - 作業の大半を自動化できており,作業時間を減少することができる. - 間違いの検証にかかる時間も大幅に減少することが可能となる. ##### 作業を進める際には以下のことを気をつけましょう. * データソースを手で加工,整形していないか * コピペを行っていないか - RのコードをRスクリプトにコピペする作業は除く * コンソールに直接コマンドを入力していないか - Rスクリプトを作成する際の動作確認やRスクリプトを実行するためのコマンドはコンソールに直接入力して良い * 手作業で結果やグラフの保存を行っていないか * 結果やグラフをコピペや手作業でレポートに貼り付けていないか - Rマークダウンでレポートを作る場合 #### RMarkdownの使い方 ##### 実際にRMarkdownでアウトプットを出力してみよう. * RMarkdownを立ち上げます.
* 画面の通りクリックします.
* Knitをクリックします. - 適宜保存等を行ってください. - テンプレート通りのアウトプットが行われます. - codeを保存しているフォルダにhtmlファイルができているので,確認してみよう.
##### Rmarkdownで編集するポイント * YAMLヘッダー: - RMarkdownのファイルのメタデータを設定 - 著者情報の編集,出力ファイルの切り替え,目次の作成などの設定が可能 - その他テンプレートなどをいろいろ組み合わせる.
* チャンク: - コードを記述する部分
- この間にRコードを記述する. - チャンクオプション:各チャンク内の動作を指定する. | チャンクオプション | デフォルト | オプションの意味 | | :----------------: | :--------: | ------------------------------------------------------------ | | echo | TRUE | チャンク内での計算結果を出力として表示するか(TRUE)否か(FALSE). | | error | TRUE | チャンク内でのエラーを表示するか否か. | | eval | TRUE | チャンク内での計算結果を評価するか否か | | fig.cap | | 図の注釈:fig.cap="Figure1" | | fig.height | 7 | 図の縦幅(インチ) | | fig.width | 7 | 図の横幅(インチ) | | include | TRUE | チャンク・実行結果を出力するか否か(FALSEでもコードは評価される). | | message | TRUE | チャンク内でのパッケージの読み込みなどのメッセージを表示するか否か. | | warning | TRUE | チャンク内での警告を表示するか否か. | | | | | ### 今回のやること #### Rマークダウンの記法 ``` ## テキストの修飾 *イタリック* _イタリック_ **太字** __太字__ ~~取り消し~~ # 見出し1 ## 見出し2 ### 見出し3 #### 見出し4 ##### 見出し5 ###### 見出し6 # 数字なし箇条書き * Item 1 * Item 2 * Item 2.1 * Item 2.2 # 数字あり箇条書き 1. Item 1 2. Item 2 1. Item 2.1 2. Item 2.2 # 改行 今日は いい天気ですね。 文章中で改行をしたい場合には、半角スペースを3つ打つ。 #リンク http://www.yahoo.co.jp はヤフーのURL [こちら](http://www.yahoo.co.jp)からヤフーに行けます。 # 引用文 学部長は > 今日の天気はよろしくない と、おっしゃった > 学部長は > > 今日の天気はよろしくない > と、おっしゃった という発言は、間違いである。とごとうは言った。 Rにおける合計を求める関数は`sum()`です。 ## 数式 $$1 + 1 = 2$$ $$x * y = 15$$ $$(身長) = (体重)\beta + \alpha + \epsilon_i $$ ## 水平線 *** 今日のお昼ご飯は何にしようかなぁ。 もう、最近仕事だらけでのんびりしたいなぁ。。。 --- ``` #### その他の形式で出力してみよう. * html以外の出力形式: - YAMLヘッダを変えることでファイル形式を変えることができる. - 1回それぞれを試してみよう. ##### htmlの時 ``` output: html_document ``` ##### wordの時 ``` output: word_document ``` ##### ioslides(プレゼンテーションその1)の時 ``` output: ioslides_presentation ``` ##### slidy(プレゼンテーションその2)の時 ``` output: slidy_presentation ``` #### データの順序付け * データの順序付け:データを分析しやすいように並び替えること. - 分析をしやすいように並べ変える必要があることがある. - Rでは自動的にアルファベット順に並べてくれる. ```{r} exdataset <- read_csv("/Users/akira/Dropbox/Education/2019MEIJI/[3_Wed2]Data_Analytics/analysis/data/exdataset.csv") exdataset ``` ##### 地域を並べ替える. ```{r echo=TRUE} factor(exdataset$ARE) ``` - 今のままだと中部,中国,北海道,関東,近畿,九州,四国,東北という順番で気持ちが悪い - 関東を一番始めとして.北から順番に並べ替えましょう. - `head()`を使うと最初の5つのデータだけを表示してくれる. - 全部並べると植えみたいに長くなってめんどくさいじゃない? ```{r echo=TRUE} ## Reordering exdataset$ARE exdataset$ARE <- factor(exdataset$ARE, levels=c("Kanto", "Hokkaido", "Tohoku", "Chubu", "Kinki", "Chugoku", "Shikoku", "Kyushu")) head(factor(exdataset$ARE)) ``` - Levelsを確認すると,関東を始めとして,北海道,東北,中部,近畿,中国,四国,九州の順番に並べ替えられる. - 『関東』を最初にする理由は今後紹介するが,「比較の基準」とするモノを #### アドインの追加 ``` install.packages("addinslist") ``` * インストールした後に,*Addins*をクリックする. * "order"で検索 * "questionr"をインストール * RStudioをとじて,再度立ち上げる. * "Addins"→"Levels Ordering"を選択 * "exdataset"→"ARE"を選択 * "Ordering"タブを選んで,並べ替える. ##### 結婚と子どもの有無についても並べ替えよう. ```{r echo=TRUE} head(factor(exdataset$MAR)) ``` * NoChild(子どもなし)を最初として,次にChild(子どもあり)として並べ替えよう. ```{r echo=TRUE} head(factor(exdataset$CHI)) ``` * NoChild(子どもなし)を最初として,次にChild(子どもあり)として並べ替えよう. * 並べ替えを手抜きするために"Addin"を使おう. - そうすればクリックだけでいろいろできる. #### データのフィルタリング * データのフィルタリングとは:データを一定の基準で分けること - ex.データを男性によるデータと女性によるデータに分けて分析を行う ```{r include=FALSE} exdataset <- read_csv("/Users/akira/Dropbox/Education/2019MEIJI/[3_Wed2]Data_Analytics/analysis/data/exdataset.csv") library(ggplot2) ## Reordering exdataset$ARE exdataset$ARE <- factor(exdataset$ARE, levels=c("Kanto", "Hokkaido", "Tohoku", "Chubu", "Kinki", "Chugoku", "Shikoku", "Kyushu")) ## Reordering exdataset$MAR exdataset$MAR <- factor(exdataset$MAR, levels=c("NotMarried", "Married")) ## Reordering exdataset$CHI exdataset$CHI <- factor(exdataset$CHI, levels=c("NoChild", "Child")) ``` #### 男性のデータだけを取り出す. * `exdataset$F_SEX`の`male(男性)`のみを取り出して,`exdataset_male`というデータセットを作って`SUB_HAP(主観的幸福度)`の平均値を算出してみましょう. * 最初にデータ全体の主観的幸福度の平均値を確認しておきましょう. ```{r echo=TRUE} mean(exdataset$SUB_HAP) ``` ```{r echo=TRUE} library(dplyr) # dplyrという関数を用いる. # もしインストールをしていなかった場合には`install.packages('dplyr', dependencies = T)`を最初の一回だけ入力する必要がある. exdataset_male <- exdataset %>% filter(F_SEX == "male") # `exdataset`について,`F_SEX`が`male`であるデータだけを取り出す. # `=`ではなく,`==`であることに注意しよう. head(factor(exdataset_male$F_SEX)) mean(exdataset_male$SUB_HAP) ``` #### 女性のデータだけを取り出す. * `exdataset$F_SEX`の`female(女性)`のみを取り出して,`exdataset_female`というデータセットを作って`SUB_HAP(主観的幸福度)`の平均値を算出してみましょう. - 各自でやってみましょう. ```{r include=FALSE} exdataset_female <- exdataset %>% filter(F_SEX == "female") # `exdataset`について,`F_SEX`が`male`であるデータだけを取り出す. # `=`ではなく,`==`であることに注意しよう. head(factor(exdataset_female$F_SEX)) mean(exdataset_female$SUB_HAP) ``` ### 今日のTake Home Messages #### RMarkdownの記法 * RMarkdown: - R上でドキュメントを作成するツール - **html**でも**Word**でも**htmlプレゼンテーション形式**でも報告可能 - 様々な記法を覚えましょう.   * データ分析をするためには,データを適切に取り扱う必要がある. - filterで分けたり,順番を並べ替えたり. ```{r} ``` ### Rでデータを扱う時に注意すべきこと * 必ず数字/文字は半角で入力する. * 日本語は使わずにローマ字を使用する. * コメントアウト(コードではなく,関係ないメモを入れること)をするときは半角の「#」から始める. - メモする内容は全角でもよい. * ファイル名およびパスには決して全角の文字(ひらがな,カタカナ,漢字,全角スペースなど)を入れてはいけない. - 半角英数字だけにする. * 慌てずに落ち着いて操作すれば,決して難しくない. - 1つずつ落ち着いて作業することを心がける. * 「わからない」ことを恐れない - 周りの友人に聞いたり,教員に確認したりしよう. * 文字化け対策に**[こちら](https://docs.google.com/document/d/1CYF6LeFeGV9dTWHGuznkO0Tm4RnhAu2KatdSqFn7bmU/edit)** のp8以降を確認して設定しよう. # 演習問題 ## 問題 ### 問題 #### 演習問題: * 次回までにご自身で分析してみたいテーマ(回帰分析1つ)+(t検定1つ)+(分散分析1つ)の帰無仮説と対立仮説を考えてきてください. * `exdataset$MAR`の`Married(既婚者)`のみを取り出して,`exdataset_Married`というデータセットを作って`SUB_HAP(主観的幸福度)`の平均値を算出してみましょう. * `exdataset$MAR`の`NotMarried(未既婚者)`のみを取り出して,`exdataset_NotMarried`というデータセットを作って`SUB_HAP(主観的幸福度)`の平均値を算出してみましょう * `exdataset$CHI`の`Child(子どもあり)`のみを取り出して,`exdataset_Child`というデータセットを作って`SUB_HAP(主観的幸福度)`の平均値を算出してみましょう * `exdataset$CHI`の`NoChild(子どもなし)`のみを取り出して,`exdataset_NoChild`というデータセットを作って`SUB_HAP(主観的幸福度)`の平均値を算出してみましょう #### リアクションペーパー: * 授業で学んだことおよび感想を下記リンクからお答えください. **[リアクションペーパー](https://forms.gle/jhMGgdhyb3sMgpWm7)** ### ヒント * こんなことがかかわるかも? - なんて,演習問題によってヒントが出たり何だりします. - ヒントがない時は気合でがんばりましょう. ```{r} ``` # データの概要 ### データ概要 ダウンロードは**[コチラ](https://akrgt.github.io/2019DA/data/exdataset.csv)**から ```{r} library(DT) DT::datatable(exdataset) ``` ### 変数名リスト #### 主観的指標 | 項目名 | データタイトル | 質問項目 | 回答 | | ------------ | -------------- | ------------------------------------------------------------ | ------------------------------------------------ | | 主観的幸福度 | SUB_HAP | 現在,あなたはどの程度幸せですか?「とても幸せ」を10点,「とても不幸せ」を0点とすると,何点くらいになると思いますか?* | 0点「とても不幸せ」-10点「とても幸せ」 | | 生活満足度 | SUB_SAT | あなたは全体として最近の生活にどの程度満足していますか?「とても満足」を10点,「とても不満足」を0点とすると,何点くらいになると思いますか? | 0点「とても不満足」-10点「とても満足」 | | 生活満足度 | SUB_SLP | あなたは最近,どの程度眠れていますか?「とても眠れている」を10点,「全く眠れていない」を0点とすると,何点くらいになると思いますか? | 0点「全く眠れていない」-10点「とても眠れている」 | #### 独裁者ゲーム 図を見て下さい. あなたはAさんです. あなたはTポイントを10ポイントを受け取りました. そのうち,あなたはBさんに何ポイントかを渡すことができます. さて,あなたはBさんに何ポイント渡しますか? ここでは以下の条件の場合について教えて下さい. | 項目名 | データタイトル | 質問項目 | 回答 | | ------------ | -------------- | ----------------------------- | -------------------- | | 主観的幸福度 | DIC_PAR | Bさんが両親の場合 | 0ポイント-10ポイント | | DG友人条件 | DIC_FRI | Bさんが友人の場合 | 0ポイント-10ポイント | | DG他者条件 | DIC_OTH | Bさんが全く知らない他人の場合 | 0ポイント-10ポイント | #### 最終提案ゲーム_提案者 図を見て下さい. あなたはAさんです. あなたはTポイントを10ポイントを受け取りました. そのうち,あなたはBさんとポイントを分け合うことになりました. あなたは,Bさんに対して分け合うポイントを提案することができます. あなたは,10ポイントの中から,Bさんに対して分けたポイントを引いた残りを受け取ることができます. しかし,Bさんがあなたの提案を拒否した場合には,その提案は実現せずに, お互いポイントをもらえないことになります. さて,あなたはBさんに何ポイント渡すことを提案しますか? ここでは以下の条件の場合について教えて下さい. | 項目名 | データタイトル | 質問項目 | 回答 | | ---------------------- | -------------- | ----------------------------- | -------------------- | | 最終提案提案者両親条件 | ULT_PRO_PAR | Bさんが両親の場合 | 0ポイント-10ポイント | | 最終提案提案者友人条件 | ULT_PRO_FRI | Bさんが友人の場合 | 0ポイント-10ポイント | | 最終提案提案者他者条件 | ULT_PRO_OTH | Bさんが全く知らない他人の場合 | 0ポイント-10ポイント | #### 最終提案ゲーム_応答者 図を見て下さい. あなたはBさんです. AさんはTポイントを10ポイントを受け取りました. Aさんが,あなたに対して分け合うポイントを提案します. Aさんは,10ポイントの中から,あなたに対して分けたポイントを引いた残りを受け取ることができます. しかし,あなたがAさんの提案を拒否した場合には,その提案は実現せずに, お互いポイントをもらえないことになります. さて,最低でも何ポイントの提案を受けたら,Aさんの提案を受け入れますか? ここでは以下の条件の場合について教えて下さい. | 項目名 | データタイトル | 質問項目 | 回答 | | ---------------------- | -------------- | ----------------------------- | -------------------- | | 最終提案応答者両親条件 | ULT_REC_PAR | Bさんが両親の場合 | 0ポイント-10ポイント | | 最終提案応答者友人条件 | ULT_REC_FRI | Bさんが友人の場合 | 0ポイント-10ポイント | | 最終提案応答者他者条件 | ULT_REC_OTH | Bさんが全く知らない他人の場合 | 0ポイント-10ポイント | #### 信頼ゲーム 図を見て下さい. あなたはAさんです. あなたはTポイントを10ポイント持っています. いくらかをCさんにあずけてください. CさんはあなたからあずかったTポイントを3倍にしてBさんに渡します. Bさんは手元に渡されたポイントのうち,いくらかをあなたに返します. この時,あなたはCさんにいくらあずけますか? ここではBさんが以下の条件の場合について教えて下さい. | 項目名 | データタイトル | 質問項目 | 回答 | | ------------ | -------------- | ----------------------------- | -------------------- | | 信頼両親条件 | TRU_PAR | Bさんが両親の場合 | 0ポイント-10ポイント | | 信頼友人条件 | TRU_FRI | Bさんが友人の場合 | 0ポイント-10ポイント | | 信頼他者条件 | TRU_OTH | Bさんが全く知らない他人の場合 | 0ポイント-10ポイント | #### 自然関連 以下の質問について4点満点でお答えください. | 項目名 | データタイトル | 質問項目 | 回答 | | -------- | -------------- | ------------------------------------------------------------ | --------------------------------- | | 自然運命 | SPN_UNM | 何かの大きな力に自分の運命は動かされているように感じることがある. | 1全くそう思わない-4非常にそう思う | | 自然感謝 | SPN_THK | 自然などの人間を超えた力に感謝の気持ちを持つことがある. | 1全くそう思わない-4非常にそう思う | | 自然恐怖 | SPN_FEA | 自然などの人間を超えた力に恐れの気持ちを持つことがある. | 1全くそう思わない-4非常にそう思う | | 自然生存 | SPN_LIV | 自然などの人間を超えた力によって,生かされていると思うことがある. | 1全くそう思わない-4非常にそう思う | | 自然大切 | SPN_IMP | 自然は大切な存在である. | 1全くそう思わない-4非常にそう思う | | | | | | #### 監視 以下の質問について4点満点でお答えください. | 項目名 | データタイトル | 質問項目 | 回答 | | ---------------- | -------------- | ------------------------------------------------------------ | --------------------------------- | | 第2者被監視感 | KAN_SEC | 日常生活の中で,直接誰か(人間)に見られていると思うことがある. | 1全くそう思わない-4非常にそう思う | | 第3者被監視感 | KAN_THI | 日常生活の中で,監視カメラ等を通じて誰か(人間)に間接的に見られていると思うことがある. | 1全くそう思わない-4非常にそう思う | | 超自然的被監視感 | KAN_SUP | 日常生活の中で,超自然的な存在に見られていると思うことがある. | 1全くそう思わない-4非常にそう思う | | 第2者被監視感 | KAN_PRD | 無機物の中に,人間の表情のようなものを見出すことがある. | 1全くそう思わない-4非常にそう思う | | 自然大切 | KAN_KYK | 人に対して共感をすることがある. | 1全くそう思わない-4非常にそう思う | | | | | | #### 死後 以下の質問について4点満点でお答えください. | 項目名 | データタイトル | 質問項目 | 回答 | | -------- | -------------- | -------------------------------------- | --------------------------------- | | 死後世界 | DED_SHI | 「死後の世界」が存在すると思いますか? | 1全くそう思わない-4非常にそう思う | | 天国 | DED_TEN | 「天国」が存在すると思いますか? | 1全くそう思わない-4非常にそう思う | | 地獄 | DED_JIG | 「地獄」が存在すると思いますか? | 1全くそう思わない-4非常にそう思う | | 奇跡 | DED_KIS | 「奇跡」が存在すると思いますか? | 1全くそう思わない-4非常にそう思う | | 天罰 | DED_PUN | 「天罰」が存在すると思いますか? | 1全くそう思わない-4非常にそう思う | | | | | | #### 性行動 以下の質問についてお答えください. | 項目名 | データタイトル | 質問項目 | 回答 | | ---------- | ---------------------------------------- | ------------------------------------------------------------ | ------------------------------------------------------------ | | 性衝動 | SEX_IMP,SEX_IMP_num(数値,欠損値有り) | あなたの性衝動はどの程度強いと思いますか?7点満点でお答え下さい.なお,答えたくない方は「8.答えたくない」を選んで下さい. | 全く弱い.2. 弱い.3. どちらかと言えば弱い.4. どちらとも言えない.5. どちらかと言えば強い.6. 強い.7. 非常に強い.8. 答えたくない. | | 自慰回数 | SEX_MAS,SEX_MAS_nen(年間回数): | あなたはどの程度の頻度でマスターベーションをしていますか?以下の選択肢の中から最も近いものを選んで下さい.なお,答えたくない方は「10. 答えたくない」を選んで下さい. | 1. 経験がない「0」, 2. 年に1回程度「1」, 3. 半年に1回程度「2」, 4. 3ヶ月に1回程度「4」, 5. 1ヶ月に1回程度「12」, 6. 2週に1回程度「26」, 7. 週に1回程度「52」, 8. 週に2-3回程度「130」, 9. 1日に1回程度「365」, 10. それ以上「730」, 11. 答えたくない「NA」 | | 性交渉回数 | SEX_SEX,SEX_SEX_nen(年間回数) | あなたはどの程度の頻度で性交渉(性行為)をしていますか?以下の選択肢の中から最も近いものを選んで下さい.なお,答えたくない方は「10. 答えたくない」を選んで下さい. | 1. 経験がない「0」, 2. 年に1回程度「1」, 3. 半年に1回程度「2」, 4. 3ヶ月に1回程度「4」, 5. 1ヶ月に1回程度「12」, 6. 2週に1回程度「26」, 7. 週に1回程度「52」, 8. 週に2-3回程度「130」, 9. 1日に1回程度「365」, 10. それ以上「730」, 11. 答えたくない「NA」 | | 性衝動対象 | SEX_OBJ | あなたの性衝動の対象として当てはまる選択肢を選んで下さい.なお,答えたくない方は「5.答えたくない」を選んで下さい. | 1.異性, 2. 同性,3. 両方,4. その他,5. 答えたくない | | 天罰 | SEX_NIN,SEX_NIN_cen(中央値) | あなたが性交渉(性行為)をしたことがある人数を教えて下さい.* 性交渉を(性行為)したことがない場合は「0. 0人」を選んで下さい. また,答えたくない方は「12.答えたくない」を選んで下さい. | 1. 0人 「0」, 2. 1人 「1」, 3. 2〜3人 「2.5」, 4. 4〜5人 「4.5」, 5. 5〜7人 「6」, 6. 8〜10人 「9」, 7. 11〜15人 「13」, 8. 16〜20人 「18」, 9. 21〜30人 「25.5」, 10. 31〜40人 「35.5」, 11. 41〜100人 「70.5」, 12. 101人以上 「101」, 13. 答えたくない.「NA」 | | 性情報開示 | SEX_NNA | 性情報に対して開示しなかった個数 | 上記5つについて答えたくないを選んだ個数 | | | | | | #### フェイスシート あなたのことについて教えて下さい. | 項目名 | データタイトル | 質問項目 | 回答 | | -------- | -------------------------------- | ------------------------------------------------------------ | ------------------------------------------------------------ | | 性別 | F_SEX | あなたの性別を教えて下さい. | 1.男性, 2.女性,3.その他 | | 世代 | F_GEN | あなたの年齢を教えて下さい. | 1. 10代前半, 2. 10代後半, 3. 20代前半, 4. 20代後半, 5. 30代前半, 6. 30代後半, 7. 40代前半, 8. 40代後半, 9. 50代前半, 10. 50代前半, 11. 60代前半, 12. 60代後半, 13. 70代以降 | | 最終学歴 | F_FGR | あなたの最終学歴を教えて下さい. | 1. 中学校卒業, 2. 高校中退, 3. 高校卒業, 4. 専門学校(短期大学)中退, 5. 専門学校(短期大学)卒業, 6. 大学中退, 7. 大学卒業, 8. 大学院修士課程(博士前期課程)中退, 9. 大学院修士課程(博士前期課程)修了, 10. 大学院博士課程(博士後期課程)中退, 11. 大学院博士課程(博士後期課程)修了 | | 個人収入 | F_INK,F_INK_cen(中央値,百万円) | あなた個人の年収を教えて下さい. | 0. 0円, 1. 1円〜200万円未満, 2. 200万円以上〜400万円未満, 3. 400万円以上〜600万円未満, 4. 600万円以上〜800万円未満, 5. 800万円以上〜1,000万円未満, 6. 1,000万円以上〜1,200万円未満, 7. 1,200万円以上〜1,500万円未満, 8. 1,500万円以上〜2,000万円未満, 9. 2,000万円以上, 10. わからない | | 世帯収入 | F_INS,F_INS_cen(中央値,百万円) | あなたの世帯での収入の合計を教えて下さい. | 0. 0円, 1. 1円〜200万円未満, 2. 200万円以上〜400万円未満, 3. 400万円以上〜600万円未満, 4. 600万円以上〜800万円未満, 5. 800万円以上〜1,000万円未満, 6. 1,000万円以上〜1,200万円未満, 7. 1,200万円以上〜1,500万円未満, 8. 1,500万円以上〜2,000万円未満, 9. 2,000万円以上, 10. わからない | | 回答端末 | F_TAN | あなたが現在回答に使われているケータイ/タブレット/パソコンについて,当てはまるものを選んで下さい. | 1. パソコン(Windows), 2. パソコン(Mac), 3. パソコン(その他), 4. タブレット(Windows), 5. タブレット(iOS,iPad), 6. タブレット(android), 7. タブレット(その他), 8. スマホ(Windows), 9. スマホ(iOS,iPhone), 10. スマホ(android), 11. スマホ(その他), 12. ガラケー,フィーチャーホン, 13. その他 | | 都道府県 | PRE | あなたのお住まいの県を教えて下さい. | 1. 北海道2. 青森県3. 岩手県4. 宮城県5. 秋田県6. 山形県7. 福島県8. 茨城県9. 栃木県10. 群馬県11. 埼玉県12. 千葉県13. 東京都14. 神奈川県15. 新潟県16. 富山県17. 石川県18. 福井県19. 山梨県20. 長野県21. 岐阜県22. 静岡県23. 愛知県24. 三重県25. 滋賀県26. 京都府27. 大阪府28. 兵庫県29. 奈良県30. 和歌山県31. 鳥取県32. 島根県33. 岡山県34. 広島県35. 山口県36. 徳島県37. 香川県38. 愛媛県39. 高知県40. 福岡県41. 佐賀県42. 長崎県43. 熊本県44. 大分県45. 宮崎県46. 鹿児島県47. 沖縄県 | | 地域 | ARE | 都道府県から地域に変換 | 北海道:1. 北海道,東北地方:2. 青森県3. 岩手県4. 宮城県5. 秋田県6. 山形県7. 福島県,関東地方:8. 茨城県9. 栃木県10. 群馬県11. 埼玉県12. 千葉県13. 東京都14. 神奈川県,中部地方:15. 新潟県16. 富山県17. 石川県18. 福井県19. 山梨県20. 長野県21. 岐阜県22. 静岡県23. 愛知県24. 三重県,近畿地方:25. 滋賀県26. 京都府27. 大阪府28. 兵庫県29. 奈良県30. 和歌山県,中国地方:31. 鳥取県32. 島根県33. 岡山県34. 広島県35. 山口県,四国地方:36. 徳島県37. 香川県38. 愛媛県39. 高知県,九州地方:40. 福岡県41. 佐賀県42. 長崎県43. 熊本県44. 大分県45. 宮崎県46. 鹿児島県47. 沖縄県| | 未既婚 | MAR | あなたはご結婚されていますか? | NotMarried:未婚,Married:既婚 | | 子の有無 | CHI | あなたはお子さんがいらっしゃいますか? | NoChild:いない,Child:いる |